Carros e Renda em Sao Paulo

data-science
sao-paulo
transporte
Author

Vinicius Oike

Published

January 15, 2024

Carros e Renda

São Paulo: fatos gerais

A Região Metropolitana de São Paulo abriga aproximadamente 20 milhões de pessoas e gera mais de 40 milhões de viagens todos os dias. Segundo Relatório do Metrô as viagens na Região Metropolitana de São Paulo dividem-se da seguinte maneira: um terço das viagens é feita por modos não-motorizados (a pé ou de bicicleta), enquanto dois terços das viagens é feito por modos motorizados. Neste último grupo, 55% das viagens são feitas com modais coletivos (ônibus, metrô, trem) e 45% das viagens são feitas com modais individuais (carro, táxi, moto). Ao todo, as viagens em automóveis particulares (excluindo táxis) representam cerca de 27% de todas as viagens diárias; ou seja, cerca de 1 em cada 4 viagens na RMSP é feita com carro particular.

O diagrama abaixo esquematiza todas as viagens diárias realizadas na RMSP. Vale notar que os dados são de 2017, então muitas das estações das linhas 4-amarela e 5-coral ainda estavam sob construção. Similarmente, as linhas 13-Jade, 15-Prata (monotrilho) ainda não estavam operando. Por simplicidade considerei o universo de todas as viagens: ainda que os deslocamentos casa-trabalho componham a maior parte deste conjunto, inclui-se todo tipo de deslocamento.

Carros por domicílio

Pouco mais da metade dos domicílios na RMSP possui algum automóvel: 53% dos domicílios possui ao menos um carro, enquanto 47% dos domicílios não possui carro particular. Mais especificamente, 43,8% possui somente um carro. Domicílios com 2 automóveis são apenas 8% do total e domicílios com 3 automóveis ou mais são pouco mais de 1% do total.

Na média da RMSP, há 0,635 carros por domicílios. Na capital, o número é similar, 0,6. Olhando para os distritos de São Paulo, vê-se que os menos “carro-dependentes” são distritos centrais como República e Sé. Distritos de baixa renda média como Parelheiros e Cidade Tiradentes também tem uma baixa razão de carros por domicílio.

Os distritos mais carro-dependentes têm rendas elevadas e estão dentro ou próximos do Centro Expandido da cidade. É curioso notar que bairros verticalizados como Moema e Morumbi aparecem junto com o distrito de Alto de Pinheiros que é majoritariamente composto por residências horizontais. Isto sugere que a verticalização não acompanha menor dependência do automóvel particular.

O mapa abaixo mostra a taxa de motorização, a razão de carros por domicílios, nos distritos da RMSP. Vê-se um padrão espacial onde as regiões com maiores taxas de motorização concentram-se no quadrante sudoeste do Centro Expandido da capital. No começo da zona oeste, na região do Tatuapé, também vê-se taxas mais elevadas. Fora da capital, vale notar que a cidade de Santana de Parnaíba tem elevada taxa de motorização, comparável aos distritos mais carro-dependentes de São Paulo.

O share de domicílios sem carro segue um padrão espacial similar. O mapa detalha as zonas OD da cidade de São Paulo. Em outro post, discuti a distribuição desta métrica na cidade.

Carros por domicílio e renda

A demanda por automóveis tende a aumentar junto com a renda das famílias. Mesmo famílias que moram em regiões centrais, próximas de polos de empregos e com boa oferta de infraestrutura urbana, preferem ter mais automóveis. O gráfico abaixo mostra a relação entre a renda domiciliar média e a razão de carros por domicílio; os dados são agregados por zona OD. A linha de tendência mostra uma relação quadrática ponderada (usando a população total de cada zona como peso).

É interessante notar as zonas que “fogem” da tendência esperada. A região do Morumbi, por exemplo, tem renda similar a do Paraíso, mas tem uma taxa de motorização consideravelmente melhor. Possivelmente, isto reflete a infraestrutura de cada bairro: o Morumbi não tem acesso fácil nem a trem e nem a metrô; já o bairro do Paraíso tem acesso fácil a duas linhas de metrô, ciclovias e corredores de ônibus.

RMSP e Centro Expandido

A demanda por automóveis também parece variar por região. O gráfico abaixo agrupa as zonas por regiões: Centro Expandido, São Paulo (capital) e RMSP (resto da região metropolitana). Nota-se que as zonas dentro do CE da capital tem uma tendência a ter menos carros do que regiões de renda equivalente na RMSP.

Note que agora os gráficos agora mostram a renda domiciliar per capita em escala logarítmica e usa-se uma tendência linear. A regressão continua sendo ponderada pela população total de cada zona, mas todos os círculos no painel da direita tem igual tamanho para facilitar a visualização dos dados.

Regressão linear

Indo um pouco mais a fundo, pode-se fazer uma regressão linear para melhor avaliar a diferença entre os grupos. Visualmente, as zonas dentro do CE parecem ter uma proporção menor de carros por habitante do que as zonas na RMSP, relativamente à renda familiar. A tabela abaixo mostra o resultado da regressão, onde adiciona-se também algumas variáveis auxiliares como a proporção de adultos (18-64 anos) que habita na zona e a densidade populacional da zona.

A relação de interesse aparece nas duas últimas linhas que indica a relação entre a renda domiciliar per capita e a localização (estrato) para a proporção de carros por domicílio. Tanto regiões dentro da capital como dentro do CE apresentam uma menor proporção de carros por domicílios, relativamente às zonas da RMSP.

Characteristic Beta 95% CI1 p-value
Prop. Adultos (%) 0.00 -0.01, 0.00 0.2
Densidade Populacional 0.00 0.00, 0.00 <0.001
Prop Ensino Superior (%) 0.00 0.00, 0.00 0.8
Renda Domiciliar per capita (log) 0.54 0.46, 0.62 <0.001
Estrato
    RMSP
    São Paulo 0.50 -0.07, 1.1 0.086
    Centro Expandido 0.56 -0.35, 1.5 0.2
Renda Domiciliar per capita (log) * Estrato
    Renda Domiciliar per capita (log) * São Paulo -0.08 -0.15, 0.00 0.060
    Renda Domiciliar per capita (log) * Centro Expandido -0.10 -0.22, 0.01 0.079
0.664
Adjusted R² 0.658
Sigma 25.1
Statistic 119
p-value <0.001
df 8
Log-likelihood 242
AIC -464
BIC -422
Deviance 303,297
Residual df 483
No. Obs. 492
1 CI = Confidence Interval

Visualmente, pode-se verificar isto no gráfico abaixo que mostra a relação entre a renda domiciliar per capita e a “demanda por automóveis” em cada um dos estratos geográficos.

Zonas

O mapa abaixo apresenta visualmente a relação entre renda e a taxa de automóveis. A classificação das zonas é simples e segue o algoritmo de Jenks sem considerar explicitamente a dependência espacial entre as zonas. Ainda assim, é possível distinguir entre as regiões. A região da Paraíso, por exemplo, é de renda alta e taxa de motorização média; Pinheiros é de renda média e taxa de motorização média; e Jardim Europa é de renda alta e taxa alta. Algumas regiões do Centro-Sul como Brooklin e Campo Belo são médio-alto (renda média e taxa alta). O centro antigo da cidade é baixo-baixo, assim como boa parte da periferia da cidade.

A maior parte das zonas classificadas é do tipo “low-low”, isto é, de renda baixa e de baixa razão carros/domicílios. De fato, quase metada das zonas entra no grupo de “renda baixa” (R$2000 a R$4500). Dentre as zonas de renda alta (> R$ 8000), a maior parte tem uma razão alta de carros/domicílio; ainda assim, uma proporção relativamente expressiva têm razão média de carros/domicílios (36%). Apenas duas zonas (MASP e Rodrigues Alves) são classificados como renda alta e baixa razão carros/domicílios.

Renda - Carros Número de Zonas Proporção de zonas
Low-Low 175 35.57%
Medium-Medium 114 23.17%
Low-Medium 63 12.80%
High-High 52 10.57%
Medium-Low 42 8.54%
High-Medium 31 6.30%
Medium-High 13 2.64%
High-Low 2 0.41%

A tabela abaixo ilustra a classificação acima trazendo alguns exemplos de cada grupo.

Renda - Carros Exemplos de Região
Low-Low Vila Morro Grande, Jaguari, Embu-Mirim, Suzano, Rochdale
Low-Medium Sabaúna, Reservatório Billings, São Lourenço da Serra, Marsilac, Vargem Grande Paulista
Medium-Low Marechal Deodoro, Presidente Altino, Luz, Santo Antônio, Santa Cecília
Medium-Medium Quitaúna, Tatuapé, Jabaquara, Vila Campanela, Rudge
Medium-High Parque da Mooca, Jardim da Glória, Parque São Jorge, Jaceguava, Granja Viana
High-Low Masp, Rodrigues Alves
High-Medium Jardim Paulistano, Trianon, Zequinha de Abreu, Chácara Itaim, Perdizes
High-High Vila Cordeiro, Chácara Flora, Tucuruvi, Pacaembu, Pompéia

Carros e renda: analisando a relação

Até agora este post assumiu que o deslocamento total de carro de uma família é, de alguma forma, proporcional ao número de automóveis que ela possui. Isto é, o número total de quilômetros rodados em automóvel particular é uma função da posse do automóvel.

Esta é uma hipótese razoável, mas como viu-se acima, a maioria dos domicílios ou não têm um carro ou tem somente um. Assim, é possível fazer ainda mais uma simplificação: considerar a posse ou não de um automóvel (ou mais).

Análise visual

Há dois fatores bastante intuitivos, indicados pela literatura, que estão relacionados com a posse de automóvel: renda e idade. O gráfico abaixo mostra a relação entre a posse de automóveis e a idade do chefe da família. Como se vê, há uma relação não-linear entre as variáveis: a proporção de famílias com automóvel cresce até certo ponto e depois diminui.

Os pontos agrupam as idades em grupos de cinco anos (18-22, 23-27, etc.) e representam a média de cada grupo. A linha de ajuste é de uma regressão polinomial de segundo grau, ajustada pelo peso proporcional da cada grupo na população total.

O gráfico de colunas abaixo mostra a proporção de domicílios que possui ao menos um carro por decil de renda. Abaixo dos eixos, apresenta-se o intervalo de renda considerado. As barrinhas pequenas são o intervalo de confiança de cada estimativa.

Regressão simples

Como agora temos uma variável binária (posse ou não-posse de automóvel) pode-se usar um modelo de escolha discreta para estudar a relação entre renda e automóveis. Na regressão abaixo, mostro os resultados de uma regressão Logística e de uma regressão Probit. A regressão é feita sobre os microdados da Pesquisa Origem Destino (identificados por domicílio) usando os fatores de expansão como pesos.

Para simplificar a análise, restringiu-se a amostra às zonas dentro da cidade de São Paulo (capital). Além disso, removeu-se domicílios com renda muita baixa (menos de 1/4 do salário mínimo da época) e domicílios chefiados por um responsável com menos de 18 anos. Esta regressão inclui algumas variáveis adicionais relevantes:

  • Criança: variável binária que indica se há pelo menos uma criança no domicílio (menor de 18 anos com vínculo familiar)

  • Ensino superior: variável binária que indica se o responsável pelo domicílio possui ensino superior.

  • Empregado: variável binária que indica se o responsável pelo domicílio estava empregado.

  • Feminino: variável binária que indica se a responsável pelo domicílio se identifica como do sexo feminino.

  • A variável de idade foi “discretizada” em grupos para melhor capturar o seu efeito não-linear.

Para levar em consideração o efeito espacial das variáveis incluiu-se efeitos fixos de cada zona OD. Existem métodos mais sofisticados para modelar a dependências espacial entre as regiões, mas para os propósitos deste post esta abordagem é suficiente. Os resultados das duas regressões é apresentado abaixo. Vale notar que apresento os odd-ratios ao invés dos coeficientes na regressão logística1. Assim, pode-se ver mais imediatamente o efeito das variáveis. Um domicílio que recebe incremento de 1% na sua renda tem um aumento de 1,9% na chance de ter um carro.

Characteristic Logit Probit
log(OR)1 95% CI1 p-value Beta 95% CI1 p-value
Renda Familiar 1.9 1.8, 2.0 <0.001 1.1 1.0, 1.2 <0.001
Criança 0.29 0.19, 0.39 <0.001 0.18 0.12, 0.24 <0.001
Idade: 25-34 0.14 -0.18, 0.45 0.4 0.07 -0.11, 0.26 0.4
Idade: 35-44 0.56 0.25, 0.86 <0.001 0.33 0.15, 0.51 <0.001
Idade: 45-54 0.53 0.23, 0.84 <0.001 0.31 0.13, 0.49 <0.001
Idade: 55-64 0.50 0.19, 0.81 0.001 0.29 0.11, 0.47 0.002
Idade: 65+ 0.49 0.18, 0.79 0.002 0.28 0.10, 0.46 0.002
Ensino Superior 0.40 0.26, 0.54 <0.001 0.24 0.16, 0.32 <0.001
Empregado 0.03 -0.08, 0.14 0.6 0.02 -0.05, 0.08 0.6
Sexo Feminino -0.90 -1.0, -0.80 <0.001 -0.53 -0.59, -0.48 <0.001
1 OR = Odds Ratio, CI = Confidence Interval

Referencias

Footnotes

  1. Isto é equivalente a tomar a exponencial do coeficiente. Isto é, ao invés de mostrar \(\beta\) mostra-se \(exp(\beta})\).↩︎